home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group98c.txt / 000021_icon-group-sender _Mon Sep 14 08:23:43 1998.msg < prev    next >
Internet Message Format  |  2000-09-20  |  2KB

  1. Return-Path: <icon-group-sender>
  2. Received: from kingfisher.CS.Arizona.EDU (kingfisher.CS.Arizona.EDU [192.12.69.239])
  3.     by baskerville.CS.Arizona.EDU (8.9.1a/8.9.1) with SMTP id IAA06280
  4.     for <icon-group-addresses@baskerville.CS.Arizona.EDU>; Mon, 14 Sep 1998 08:23:42 -0700 (MST)
  5. Received: by kingfisher.CS.Arizona.EDU (5.65v4.0/1.1.8.2/08Nov94-0446PM)
  6.     id AA01577; Mon, 14 Sep 1998 08:23:15 -0700
  7. To: icon-group@optima.CS.Arizona.EDU
  8. Date: 12 Sep 1998 07:30:31 GMT
  9. From: MUSKB@luff.latrobe.edu.au (Bastin,kim)
  10. Message-Id: <6td7un$cpr$2@news.latrobe.edu.au>
  11. Organization: La Trobe University
  12. Sender: icon-group-request@optima.CS.Arizona.EDU
  13. References: <4FD6422BE942D111908D00805F3158DF0757B57E@RED-MSG-52>
  14. Subject: Re: Unicode support or support for non-ASCII based character ma
  15. Errors-To: icon-group-errors@optima.CS.Arizona.EDU
  16. Status: RO
  17.  
  18. Todd Proebsting (toddpro@microsoft.com) wrote:
  19. : Jcon (http://www.cs.arizona.edu/icon/jcon) originally used Java's Unicode
  20. : strings as the basis for implementing Icon strings.  This was trivial to do,
  21. : and we (Gregg Townsend and I) would have kept that implementation except
  22. : that it was much too slow.  I blame this in large part on the Java "String"
  23. : implementation, and not on Unicode.  (Although Unicode obviously wastes a
  24. : lot of space in applications that are just using the ASCII subset.)
  25.  
  26. : Prior to switching to ASCII, we never faced the problem of what was the
  27. : "right" thing to do with pre-defined csets with Unicode.  For instance, what
  28. : are the elements of the cset &ucase in an Unicode world?
  29.  
  30. : Todd Proebsting
  31.  
  32. Icon's &ucase (A-Z) is based on the English alphabet.  Other European
  33. languages would add @ADCG... etc.  But it doesn't stop there.
  34. Whether you have upper vs lowercase at all depends on the alphabet.  
  35. Not all alphabets have such a distinction.  Some have other distinctions 
  36. that are novel to users of the Roman alphabet.  For example, Greek, 
  37. Hebrew and Arabic have special 'final' forms of some characters (used at 
  38. the end of a word).
  39.  
  40. Kim Bastin
  41.  
  42.